یک الگوریتم مبتنی بر گراف برای خلاصه سازی متون

thesis
abstract

سیستم های خلاصه برداری از متن، یافتن اطلاعات مورد نیاز را از میان خیل عظیم اطلاعاتی که در قالب متن هستند، تسریع می کنند. این سیستم ها از روش های مختلفی برای انتخاب مهم ترین موضوعات متن استفاده می کنند. یکی از روش هایی که در این زمینه به صورت گسترده مورد استفاده قرار می گیرد، استفاده از ساختار گراف و ویژگی های آن برای انتخاب مهم ترین جملات متن است. الگوریتم ارائه شده در این تحقیق، سعی در خلاصه سازی متون فارسی با استفاده از ساختار گراف و ساختن مسیر بر اساس آن دارد. الگوریتم پیشنهادی، متن ورودی را به صورت گراف نمایش داده و با استفاده از ویژگی های ساختار گراف، روش های آماری، ویژگی های ساختاری متن و استفاده از مسیرها، مهم ترین و پر محتواترین جملات متن را انتخاب می کند. نوآوری این الگوریتم در مقایسه با کارهای پیشین، استفاده از مسیرها و بررسی میزان اهمیت ارتباط موجود بین جملات، به منظور حفظ هر چه بیشتر انسجام و جریان موضوعی متن است. برای ارزیابی کیفیت خلاصه تولیدی، میزان شباهت آن با خلاصه انسانی مورد بررسی قرار گرفته است. نتایج بررسی ها نشان می دهد که الگوریتم ارائه شده در مقایسه با کارهای پیشین مطرح شده در زمینه خلاصه سازی متون فارسی، خلاصه ای با شباهت بیشتر به خلاصه انسانی تولید می کند.

similar resources

معرفی الگوریتم خلاصه سازی معناگرای sigs برای گراف های عظیم الجثه

امروزه گراف ها به طور گسترده در بسیاری از حوزه ها از جمله نرم افزار، شبکه، وب، شیمی، زیست، ژنتیک و حتی مخابرات و جامعه شناسی برای مدل سازی و پردازش داده ها استفاده می شوند. حجیم بودن و پیچیدگی زیاد گراف های داده، یکی از مهم ترین چالش ها در این زمینه است که کار استخراج اطلاعات و دانش مورد نیاز از میان مجموعه ای از داده ها را بسیار مشکل می سازد. در چنین شرایطی، استفاده از الگوریتم های خلاصه سازی ...

full text

بهبود خلاصه سازی خودکار متون فارسی با استفاده از روش‌های پردازش زبان طبیعی و گراف شباهت

A significant amount of available information is stored in textual databases which contains a large collection of documents from different sources (such as news, articles, books, emails and web pages). The increasing visibility and importance of this class of information motivates us to work on having better automatic evaluation tools for textual resources. The automatic summarization of tex...

full text

یک الگوریتم ابتکاری برای تجدید آرایش شبکه‌های توزیع به منظور کاهش تلفات اهمی مبتنی بر نظریه‌ی گراف

One of the ways of reducing active power losses in the distribution networks is using the network reconfiguration for different load levels. Since the number of possible configuration of a distribution network is usually very much and then review of all of them (especially in the network of large-scale) to finding the optimal configuration is not possible simply, therefore in this paper a new a...

full text

خلاصه سازی خودکار متون فارسی مبتنی بر هستی شناسی

با توجه به گسترش روزافزون اطلاعات در دسترس از طریق اینترنت، لزوم استفاده از روش های خلاصه سازی خودکار متن، بیش از پیش احساس می شود. روش هایی که با استخراج مهمترین مطالب موجود در اسناد مانع از مطالعه کامل حجم انبوه از آنها شوند. خلاصه سازی عبارت است از فشرده سازی متن (متون) منبع و تولید یک نسخه کوتاه تر از آن به نحوی که محتوای اطلاعاتی آن حفظ شود. اغلب سیستم های خلاصه ساز با استفاده از روش های س...

15 صفحه اول

یک الگوریتم ابتکاری برای تجدید آرایش شبکه های توزیع به منظور کاهش تلفات اهمی مبتنی بر نظریه ی گراف

یکی از راهکارهای کاهش تلفات در شبکه​های توزیع استفاده از تجدید آرایش فیدرهای فشار متوسط متناسب با سطوح بار مختلف سیستم است. تعداد آرایش​های ممکن یک شبکه­ی توزیع بسیار زیاد است و امکان بررسی تمام آرایش​ها (مخصوصاً در شبکه​های با مقیاس بزرگ) برای یافتن آرایش بهینه به راحتی میسر نیست. در این مقاله یک الگوریتم جدید مبتنی بر نظریه­ی گراف و الگوریتم­های توسعه یافته­ی آن برای تجدید آرایش شبکه​های توزیع...

full text

ارائه یک سیستم هوشمند و معناگرا برای ارزیابی سیستم های خلاصه ساز متون

Nowadays summarizers and machine translators have attracted much attention to themselves, and many activities on making such tools have been done around the world. For Farsi like the other languages there have been efforts in this field. So evaluating such tools has a great importance. Human evaluations of machine summarization are extensive but expensive. Human evaluations can take months to f...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - پژوهشکده اقلیم شناسی

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023